Isolation forest

Isolation Forest (en español Bosque de aislamiento) es un algoritmo para la detección de anomalías en los datos desarrollado inicialmente por Fei Tony Liu en 2008.[1]Isolation Forest detecta anomalías utilizando árboles binarios. El algoritmo tiene una complejidad temporal lineal y requiere poca memoria, por lo que funciona bien con grandes volúmenes de datos.[2][3]​ En esencia, el algoritmo se basa en las características de las anomalías, es decir, que sean pocas y diferentes, para detectarlas. En el algoritmo no se realiza ninguna estimación de la densidad. El algoritmo se diferencia de los algoritmos de árbol de decisión en que sólo se utiliza la medida o aproximación de la longitud del camino para generar la puntuación de la anomalía, no se necesitan estadísticas de los nodos hoja sobre la distribución de clases o el valor objetivo.

El bosque de aislamiento es rápido porque divide el espacio de datos de forma aleatoria, utilizando un atributo seleccionado al azar y un punto de división seleccionado al azar. La puntuación de la anomalía está inversamente asociada a la longitud del camino, ya que las anomalías necesitan menos divisiones para ser aisladas, debido a que son pocas y diferentes.

  1. «Isolation Forest». SourceForge (en inglés). 7 de julio de 2014. Consultado el 3 de mayo de 2024. 
  2. Liu, Fei Tony; Ting, Kai Ming; Zhou, Zhi-Hua (2008). «"Isolation Forest"». 2008 Eighth IEEE International Conference on Data Mining. ISBN 978-0-7695-3502-9. doi:10.1109/ICDM.2008.17. 
  3. Liu, Fei Tony; Ting, Kai Ming; Zhou, Zhi-Hua (1 de marzo de 2012). «Isolation-Based Anomaly Detection». ACM Transactions on Knowledge Discovery from Data 6 (1): 3:1-3:39. ISSN 1556-4681. doi:10.1145/2133360.2133363. Consultado el 3 de mayo de 2024. 

© MMXXIII Rich X Search. We shall prevail. All rights reserved. Rich X Search